网络首发 | 姚清晨 黄璜:聊天机器人在公共部门管理中的应用研究综述
网络首发时间
2022-11-02
网络首发地址
https://kns.cnki.net/kcms/detail/42.1085.G2.20221102.0925.002.html
Photo by Ryan Howerter on Unsplash. |
姚清晨
北京大学政府管理学院,北京,100871
黄璜
北京大学国家治理研究院,北京,100871
北京大学政府管理学院,北京,100871
北京大学公共治理研究所,北京,100871
目的 | 意义 | 随着政府数字化转型的不断推进,聊天机器人技术被越来越多的公共部门采用,应用于各种治理场景,对研究现状进行梳理和分析,有助于了解新兴技术应用趋势,并为进一步探索提供研究借鉴。 | |
研究设计 | 方法 | 首先进行文献调查,从 Web of Science、中国知网和谷歌学术等数据库以及未名学术等网站中,收集2022年10月6日之前发表的与聊天机器人在公共部门应用相关的当前研究文章;然后用归纳法将当前公共部门应用聊天机器人相关研究归纳为四个方面,即定义与分类、价值与限度、主要应用场景、影响因素与用户信任及其评估。 | |
结论 | 发现 | 对于公共部门,聊天机器人具有一般性和特别性两个方面的应用价值,同时存在技术和应用两个方面的限度,相关应用场景主要围绕公共信息服务与政民互动、政府数据开放与数据管理、突发公共事件应急管理等展开。聊天机器人的应用以及用户对聊天机器人的信任受到环境、组织、技术等诸多外部因素的影响,相应的评估框架与测评指标也涉及效率、有效性和满意度等诸多方面。 | |
创新 | 价值 | 多维度阐述公共部门应用聊天机器人研究进展,分析研究要点和不足之处,提出未来研究方向,为后续研究提供参考。 | |
关键词 | 聊天机器人;智能问答机器人; 公共部门;数字政府;智能化 |
1 引言 |
近年来,我国数字政府建设受到各方面重视并取得许多重要成果。新近发布的《关于加强数字政府建设的指导意见》(国发〔2022〕14号)要求“构建数字化、智能化的政府运行新形态”“全面提升公共服务数字化、智能化水平”。从全球治理实践来看,人工智能技术已经被广泛地运用于公共服务与公共治理实践中,在改善服务、促进参与、预防风险等方面发挥重要作用。聊天机器人(chatterbot,缩写为chatbot)是人工智能技术的典型应用之一。早在1966年,美国麻省理工学院人工智能实验室的约瑟夫•魏泽鲍姆(Joseph Weizenbaum)等人受图灵测试(The Turing Test)的启发,设计出了第一个聊天机器人――ELIZA。所谓图灵测试,即计算机科学之父艾伦•图灵(AlanTuring)在1950年给出的思想实验:由一个“审问者”通过提问来识别人与机器,如果审问者无法识别出机器,则认为机器能够进行“思考”。此后,随着人工智能技术的发展,聊天机器人技术经历了十余次的迭代升级。目前全球公认较为先进的聊天机器人技术隶属于各大IT巨头,如苹果的Siri、亚马逊的Amazon Lex和微软的LUIS等。
同许多其他技术一样,聊天机器人最早由企业开发并首先应用于商业领域。自然语言处理(Natural Language Processing, NLP)技术的改进和在线消息传递成为主要服务沟通渠道,共同促成了聊天机器人在零售行业的普及。公共部门对聊天机器人技术的应用起始于公共服务、信息公开等场景,其后被不断扩展,具体用途包括但不限于咨询、投诉、建议、即时响应等,主要用于满足政府与民众之间的沟通需求,提高政府与民众沟通的透明度,并改善民众获取公共服务的便利性。比如,加拿大安大略省劳动培训和技能发展部使用人工智能驱动的聊天机器人为公共部门员工提供培训注册、查询和引导服务;澳大利亚税务局于2016年2月上线了虚拟助手Alex,为客户提供信息服务。我国已经有不少地方政府部门在数字政府建设中引入了聊天机器人技术,用来提高政府网站的智能化水平和交互能力。我国也有学者较早在研究中提出了利用人工智能技术在政府网站建设客服机器人的构想。有研究表明,在数字政府建设中应用聊天机器人对于政府和公众而言均有裨益。一方面能够让政府工作人员从重复性劳动中解脱出来,从事更具创新性的工作;另一方面能够让公众的问题和投诉得到快速回应,不用受时间的限制,进而促进公民对政府的信任。聊天机器人还可以与服务部门作为一个混合团队(hybrid team)一起工作,将前者快速处理信息的能力和后者的同理心以及环境评估能力结合起来,重组现有资源,提升公共服务效能。
尽管以聊天机器人为代表的智能化技术在政府治理中的创新应用已获得快速发展,国内公共管理学界对于这个新兴研究领域的研究还甚少。本文研究目的即对国内外关于聊天机器人在公共部门中的应用相关研究文献进行梳理和综述,以期对相关研究形成系统性认知,并为后期实证研究的展开奠定基础。
2 数据与方法 |
学术界对聊天机器人的研究大致可以分为两类。一类是从计算机科学视角出发,研究聊天机器人作为人工智能技术的发展,偏向基础性研究;另一类研究更具应用导向,主要研究聊天机器人在不同领域的具体应用及相关话题,比如教育学中研究聊天机器人在学校教育中的应用,心理学则研究聊天机器人对于人心理的作用等。
本文聚焦聊天机器人在公共部门管理中的应用。相关文献的检索策略是:第一,选取Web of Science(WoS)和中国知网(CNKI)数据库分别进行国内外文献检索,同时利用Google学术、未名学术等网站辅助检索相关研究成果;第二,以关键词和主题作为检索路径,其中外文文献检索词包括“public/government” + “chatbot/chatterbot”共四种组合,中文文献检索词包括“公共/政府/政务/”+“聊天机器人/智能问答机器人/AI/人工智能”共十二种组合;第三,文献类型剔除专利和临床试验,保留学术期刊论文、会议论文、研究机构或国际组织的研究报告等;第四,对文献的筛选依据是公共部门应用聊天机器人所涉话题,或直接聚焦,或研究其他主题但与此相关,且非计算机领域的研究①;第五,检索时间截止到2022年10月6日。
最终共获得78篇有效文献,包括英文文献56篇、中文文献20篇、韩文文献2篇。其中,直接聚焦公共部门应用聊天机器人的英文文献有32篇、中文文献为5篇;其他文献围绕人工智能在政务服务或政府治理中的应用展开,其中也涉及到聊天机器人的应用情况。如表1所示,从时间分布看,2018年之前发表了8篇文献,其中中文文献仅2篇;而2018年以后(含)发表了70篇文献,占有效文献的将近90%,其中2019年及之后每年都在14篇以上。从文献类型看,期刊论文共计55篇、会议论文18篇、研究报告5篇。从文献来源看,电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)及其旗下期刊贡献了4篇英文文献,Government Information Quarterly和International Journal of Human-Computer Studies分别发表2篇论文。在中文期刊中,《电子政务》共计发表11篇有效论文。
表1 年度载文量统计 |
基于上述文献,本文将相关研究内容划分为四个方面:定义与分类、应用价值及限度、应用场景、影响因素与用户信任及其评估,分别阐明“什么是聊天机器人”“公共部门为何应用聊天机器人及其可能风险”“公共部门如何应用聊天机器人”“公共部门采用聊天机器人的影响因素”“用户信任聊天机器人的影响因素”以及“如何对应用效果和用户信任度进行评估”等问题。
①有些文献虽然也是研究公共部门如何在服务供给中应用聊天机器人,但是研究内容主要是技术设计和应用开发,与公共管理研究无关,也会被剔除。 |
3 聊天机器人的定义与分类 |
3.1 聊天机器人的定义
简单而言,聊天机器人即一种人机对话智能程序,使人类与数字设备的交互就好像与真人交流一样。作为一种智能代理(Intelligent Agents),聊天机器人有能力理解一种或多种人类语言,它通过发送短信、语音命令或两者结合的方式来模拟与自然的人类进行对话,因此也被称为“智能问答机器人”或“智能聊天机器人”。从功能维度看,聊天机器人通过基于文本或基于语音的对话服务,识别用户需求,对服务查询做出响应,有时还可以预测用户行为。有学者认为,聊天机器人是人工智能和人类智能交织在一起的最有趣的新交流工具之一,可能会改变人们在互联网上处理数据和服务的方式。如前所述,由于自然语言处理技术的发展提高了对话质量,各类通讯应用程序使用量逐渐增长,同时公众对更加优质客户服务的需求不断提升,聊天机器人已经成为公共部门中流行的交流工具。
在实现方式上,聊天机器人既可以作为独立的应用程序,也可以应用在其他任何在线聊天或消息传递的应用程序中,如网页、即时通讯工具、聊天应用程序或移动应用程序等。在运行方式上,聊天机器人通过前述实现方式,与用户进行文本或语音交互;其服务器由逻辑与规则解析器和知识库组成,通过识别输入文本,触发基于预定义规则的响应,或通过自然语言处理模块执行情感分析以验证输入文本,并指示知识库对结果做出相应的响应。
基于上述定义,智能化是聊天机器人的核心特征,换言之,聊天机器人是人工智能技术的典型应用之一。有学者持审慎态度,认为聊天机器人只是狭义人工智能(Narrow AI或Artificial Narrow Intelligence,ANI)形式,即根据用户输入识别有意义的信息,寻找用户意图并做出适当回应。狭义人工智能只能被用来执行特定任务,这区别于“通用人工智能(Artificial General Intelligence,AGI)”,后者的能力被认为至少应当与人类相当,可以替代大部分过去需要自然人才能从事的活动,诸如社会生产、交际乃至重大决策。因此,也有学者对正在被广泛使用的大多数聊天机器人的技术是否真正有资格被定位为人工智能表示质疑。尽管如此,聊天机器人的供应商和那些使用聊天机器人的地方政府依然十分乐意为他们的聊天机器人贴上人工智能的标签。
3.2 聊天机器人的分类
无论是所谓“狭义人工智能”还是其他质疑,实际上都是对聊天机器人所依托技术的复杂程度存在认知上的差异。依据技术的复杂程度,可以将聊天机器人划分为基于语言规则(Linguistic Rule-based)和基于人工智能(AI-based)两种类型,分别对应狭义人工智能和通用人工智能。前者也被称为决策树机器人,其特征是能够回答预先设定的固定问题。由于输入选项通常是限定的,基于规则的聊天机器人无法从实时对话中进行学习,会话流程也不够灵活。后者则扮演真正的“人类”与用户进行互动,具有跟踪联想和从对话中学习的能力。
聊天机器人还可以依据其他标准进行划分。如依据用户查询和需求响应的形式划分为文本到文本机器人(Text-to-text bot, TTT)、文本到语音机器人(Textto-speech bot, TTS)、语音到文本机器人(Speech-to-text bot, STT)和语音到语音机器人(Speech-to speech bot, STS)。又如依据技术所要实现的目的划分为基于目标的聊天机器人(Goal-based chatbot)、基于知识的聊天机器人(Knowledge-based chatbot)、基于服务的聊天机器人(Service-based chatbot)和基于响应生成的聊天机器人(Response generated-based chatbot)等,不一而足。
同样,在公共部门管理中应用的聊天机器人也可划分为不同类型。首先,最简洁的方式是根据应用场景划分为政务服务类、投诉咨询类、社区安全类、医疗保健类、教育管理类和交通管理类等。其次,按照公共组织拥有的资源以及希望通过聊天机器人提供服务的领域或数量,可以划分五种类型:基于检索的目标导向型(Goal-oriented chatbot–Retrieval Based)、目标导向型联合网络(Network of goal oriented chatbots)、生成型(Generative chatbot)、脚本/步骤型(Scripted/sequential chatbots)和会话型(Conversational chatbots)。这些类型还可以相互组合形成新的类型,如目标导向的会话型聊天机器人。再次,还有学者根据公共服务供给的复杂程度对聊天机器人进行类型划分。先是依据技术复杂程度划分为基础型(basic)和高级型(advanced)两大类,并进一步依据算法、对话框管理、数据库、身份验证、交互等技术性能将两大类分别划分为若干子类型。二是依据复杂程度将公共服务划分为服务分类(service triage)、服务信息收集和分析(service information gathering and analysis)、服务协商(service negotiation)三个等级,其中服务分类主要是理解公民请求并根据规则确定适当的服务;服务信息收集和分析则主要指多个来源访问和收集数据,以使用户的服务体验更具个性化;服务协商是指根据申请人情况和服务需求提供与之匹配的服务,还包括为用户提供详细的操作说明。三是为不同等级的公共服务匹配具有适当技术特性的聊天机器人。
4 聊天机器人在公共部门的 应用价值及其限度 |
对于聊天机器人在公共部门的应用价值,一部分文献持积极态度,着重阐述其优势与意义;另一部分文献则持审慎态度,对缺陷和不足展开探讨。
4.1 公共部门应用聊天机器人的价值
聊天机器人在公共部门的应用价值可以分为一般性和特别性两个方面。就一般性价值而言,聊天机器人本身对个人可以产生积极影响,这也是公共部门引入聊天机器人技术的主要动因。关于一般性价值的研究主要基于人机交互(Human-Compute rInteraction,HCI)视角展开。Ho等认为,随着聊天机器人对话能力的提升,研究界应当对聊天机器人通过交流向用户传达的情感、关系与心理影响等给予更多关注。
此类研究普遍认为聊天机器人的普及一定程度上改变了人与计算机进行交互的模式,一方面人可以在与聊天机器人的互动中受益,另一方面聊天机器人应当被赋予更多的社会特征。根据社会渗透理论(Social Penetration Theory)②,个体间的关系会由不亲密向亲密发展,人与聊天机器人的关系(Human-Chatbot Relationships, HCRs)也体现出一定的阶段性特征:在建立期,HCRs具有受用户好奇心驱使的“表面特征”(superficial character);在发展期,用户的参与度和对自我表露(self-disclosure)的信任度得到提升,HCRs的特征体现为大量的情感探索和参与;在稳定期,用户和聊天机器人之间的互动频率可能会降低,但HCRs已经具备了实质性的情感联系和社会价值。由此,用户可以在与社交机器人的互动中获益,HCRs能够对用户的幸福感产生积极影响。除此以外,与聊天机器人互动还对用户压力的自我感知产生积极作用。有实证研究表明,由计算机生成的情感支持能够有效减轻人们的压力,前提是人们被告知这些支持是来自其他人而非机器人。
人与聊天机器人的关系会受到聊天机器人社会特征的影响。有研究提炼了11个聊天机器人的主要社会特征,并归纳为三大类:会话智能(conversational intelligence)、社交智能(social intelligence)和拟人化(personification)。其中,会话智能指聊天机器人进行有效对话的能力,包括主动性、尽责性和沟通能力。会话智能使聊天机器人的对话更加简洁、有趣且富有成效。所谓社交智能,此处指聊天机器人为实现预期目标而开展适当社会行为的能力,包括冲突管理、语言使用、礼仪、道德、情商和个性。社交智能使聊天机器人更具可信度和人情味,增进与人类的融洽关系。拟人化指使非人类代理被赋予人的特征,包括外表和情绪状态。为聊天机器人赋予人们所期望的社会特征,能够促进交互的顺利开展。有实证研究表明,具有社会临场感③(social presence)和人声对话功能的聊天机器人在很大程度上增强了公众对组织倾听(organizational listening)和组织透明度(organizational transparency)的认知,这一认知又对公众与组织关系产生了积极影响。
聊天机器人的特别价值是指聊天机器人对公共部门的优势和意义。这类研究定位政府与公民沟通的具体场景,认为聊天机器人能够促进政府与民众之间沟通模式的转型,因而主张将聊天机器人应用于“公共性”场景之中。如Følstad等认为,聊天机器人能够提高服务的可获得性和可利用性,并降低服务供给成本,因而具有应用于社会公益(Social Good)的潜力。这类研究的一个核心观点是,聊天机器人的应用能够改善政府与民众之间的沟通效能,从而体现出两个方面的价值取向,即效率和公平。效率方面,如前所述,作为人工智能技术在公共部门中的应用形式之一,聊天机器人具有许多优势,如使用聊天机器人交付服务和提供信息比使用需要持续培训和监控的人工方式更加方便快捷、可以实现“24小时×7天”的全天候服务、可以与任何其他系统“拼凑”集成、多语言支持、可同时在多个平台上运行等。此外有证据表明,聊天机器人技术能够对公共服务的个性化供给提供帮助。在“公平”方面,Følstad等关注了聊天机器人技术用于社会公益事业所彰显的民主化、均等化和包容性等价值。具体包括:首先,聊天机器人不受用户数量的限制,可以同一时间为数十亿用户提供及时性信息;其次,聊天机器人使用简单的自然语言进行对话与沟通,这使得政府在为公众提供数据和服务时几乎没有门槛,奠定了公共服务均等化的技术基础;再次,这种简洁日常的对话特性使聊天机器人能够覆盖更多的用户群体,特别是那些数字素养及技能掌握程度较低的人,进而成为弥合数字鸿沟的桥梁,为构建普惠包容的数字社会提供技术支持等。
②社会渗透理论由欧文•阿特曼和达尔马斯•泰勒(Irvin Altman and Dalmas Taylor,1973)提出,指个体之间从表面化的沟通到亲密的沟通而经历的关系发展过程。引自:侯玉波编著.社会心理学:北京大学出版社,2007-8:130-131. ③社会临场感,又称社会存在、社会表露、社会呈现,指在利用媒体进行沟通过程中,一个人被视为“真实的人”的程度及与他人联系的感知程度。转引自:腾艳杨.社会临场感研究综述[J].现代教育技术,2013,23(3):64-70. |
4.2 公共部门应用聊天机器人的限度
在理论层面展开的反思认为,一方面,技术治理是有限度的,技术治理本身并不自带现代化属性,不能破解行政机构的内在缺陷;另一方面,单一的治理技术也无法适应多元化的治理场景。具体到公共部门的应用,聊天机器人的限度又表现在两方面,一是聊天机器人技术本身的限度,二是在公共部门应用过程中暴露出的缺陷与不足。
聊天机器人技术本身的限度可以归纳为三个方面。首先,虽然聊天机器人总是被当作双向交流的工具,但实际上用户总是可以随时无理由地退出交流,这将导致用户反馈的缺失和交流的中断。其次,聊天机器人在拟人化方面仍然不足。有研究对应对新冠肺炎疫情的政府聊天机器人进行测评后发现,聊天机器人很少使用沟通策略,也缺乏个性特征。再次,用户可能缺乏特定领域的知识,而公共服务聊天机器人无法纠正用户因知识缺乏而导致的错误,即聊天机器人无法理解用户提出的语言结构不合理的问题。
聊天机器人在公共部门的应用过程也存在缺陷与不足,如可能会同其他人工智能技术一样,在开发和使用过程中出现技术错误、侵犯隐私、资源浪费等问题,从而可能面临法律、制度、伦理、经济和组织管理等方面的困境。传统公共管理者的信息角色、决策角色以及服务角色也可能因为人工智能的深度嵌入而遭到挑战和冲击。具体来讲,第一,有些组织引进聊天机器人可能只是基于流行趋势而非经过调查,公共部门也可能因为缺乏责任感而导致服务效果的下降。第二,由于数字鸿沟的存在,公民可能无法准确评估聊天机器人的积极价值,从而不理解和不愿意使用。第三,在公共管理活动中应用聊天机器人,形式上的效果可能会大过内容,即所谓“新瓶装旧酒”。有研究通过对拉脱维亚、维也纳和波恩的公共行政部门使用的三个聊天机器人进行观察后发现,聊天机器人的引入并未引发公共服务供给的根本性改变,也没有因聊天机器人技术的实施而对治理体系、公民参与或政策制定过程产生改革效应。第四,在公共服务供给中应用聊天机器人经常受到争议,或被认为宣传效果不佳,并可能遇到法律方面的困扰。造成这种情况的一个重要原因是,用户和广大公众并不总是认为以聊天机器人为中介的服务彰显了适当的公共服务价值。
综上,聊天机器人在公共部门的应用一方面受制于聊天机器人技术本身的成熟度和完善度,尚未达到足够先进以适应更加多元和更高需求的公共部门应用场景;另一方面受制于技术在应用于公共部门过程中所面对的固有难题。对这些限度与约束条件的反思与审视有助于深化对公共部门应用聊天机器人的全面认知,并推动相关实践的开展。
5 聊天机器人在公共部门的主要应用场景 |
不同能力的聊天机器人只有与不同复杂程度的应用场景进行正确匹配,才能发挥最佳效用。
聊天机器人在公共部门管理中的应用研究主要围绕三类场景展开:公共信息服务与政民互动、政府数据开放与数据治理、突发公共事件应急管理。在这些场景中,聊天机器人一般会同时扮演两个角色:一是作为公共服务的内容,或为公众提供的技术服务;二是作为公共服务的工具,为公共服务尤其是信息公开和数据开放等提供便利。需要说明的是,这些应用场景在现实中并非界限分明,而是存在着交叉重叠,如应急管理也涉及数据管理,数据公开通常也离不开政民互动。
5.1 公共信息服务与政民互动中的应用
利用人工智能提升信息服务水平已经成为世界各国实现创新发展的重要议题。学者们认为,通过变革互动方式,基于AI和人机交互技术的聊天机器人正在改变在线公共服务的性质。但是,目前的聊天机器人大多针对特定场景定制,只能对简单问题和命令做出识别与回应,不能应用于复杂的或关涉更多事实的领域。换言之,基于语言规则建构的聊天机器人只能在事先定义的规则框架下发挥作用,不能响应任何定义规则之外的查询,因而无法满足当前政民互动的需求,并且这种聊天机器人的研发属于高劳动密集型的工作,开发速度十分缓慢。
基于人工智能的聊天机器人则试图解决或至少缓解上述问题。以搜索引擎为例,基于人工智能能够更好地获取用户需求、预测用户兴趣和访问偏好,提高检索效率和精确度。在政务服务信息推送中,人工智能也发挥了积极作用。有文献特为此构建了一个“用户-技术-资源”分析框架,用于分析政务服务智能推送的实现机理。来自印尼的Firdaus等介绍了一种旨在向用户提供印尼电子信息和交易法相关信息的智能聊天机器人,可以帮助搜索相关法律文件,以应对公众因不熟悉法律而违法的问题。Stamatis等设计的聊天机器人可以集成“生活事件”④(Life Events, LE),形成公共服务信息供给体系。
欧盟委员会(European Commission, EU)也曾就公共服务聊天机器人架构发布过一项报告,详细介绍了启动聊天机器人项目前应考虑的因素、聊天机器人应如何与用户进行交互等议题,并为成员国公共行政部门进一步开发各级聊天机器人解决方案提供了下一步措施建议。例如,关于聊天机器人的部署,报告认为即时通讯类应用平台因用户数量增长迅速而具有一定优势。又如,关于如何与用户进行交互,报告指出聊天机器人的一个巨大优势是充满了各种交互可能性,既可以是中立的,也可以是具有个性的,并能够针对不同场景使用不同的形象(avatar)和不同的沟通渠道(channel)。再如关于治理与维护,报告认为应该从反馈(feedback)、学习(learning)和监控(monitoring)三个方面着手实施。报告最后提出了一些建议,如使用目标导向型聊天机器人联合网络可以在资源相对有限的情况下整合不同的信息服务;又如让聊天机器人以图标或对话栏的形式显示在网页上是最合适的,因为用户在使用聊天机器人时仍然可以使用该网页;再如公共部门在开发聊天机器人时可以设置尽可能多的相关功能(例如支付功能)。此外,公共部门聊天机器人应该具备身份验证功能,并使用多种语言等等。
除了应用于公共信息服务和政民互动,聊天机器人的应用场景还可以延伸至对公共服务绩效水平的监测。比如,马达加斯加在2019年启动了一项名为CivicTech的试点项目,即通过基于Facebook开发的聊天机器人,第三方和公民能够实现对公共部门绩效项目服务交付的监控。实践表明,CivicTech使公民克服了收入、社会地位和地理等方面的障碍,实现了与政府的互动。
④ LE 是一种综合公共服务供应的方法,包括一组需要按特定次序执行的公共服务,以便提供综合公共服务,从而满足市民的需要。 |
5.2 政府数据开放与数据管理中的应用
数据开放与数据管理是公共部门聊天机器人应用的另一主要场景。首先,通过将数据开放与聊天机器人相结合,能够提升政府开放数据的可访问性。聊天机器人的特性之一是能够与公众进行对话式交互,通过需求的精准化识别实现服务的精准化供给。通常来说,公众对获取政府数据的需求并非在一开始就十分明确,而是“边查询、边搜索、边明确”。如果将聊天机器人设置为政府信息公开或数据开放的接入口,公众既可以向聊天机器人直接表达其信息或数据获取需求,又可以在与聊天机器人的交互中逐渐明确自己的需求。与聊天机器人交互的过程,也是公众不断学习深入的过程。
其次,聊天机器人可以提高数据管理的整体效率。聊天机器人不仅可以用于处理非结构化数据,还能通过与人类的对话交互向人类提供所需数据。Meng-HanTsai等基于台湾灾害应急部门的一项为期两年的实地测试,构建了一个EUSM四阶段框架,即现有工作流程审查(Existing workflow review)、可用性评估(Usability evaluation)、系统改进(System improvement)和管理计划(Management plan)。研究表明,该框架可以帮助组织明确工作流程,提高聊天机器人系统的整体效率,并识别引入聊天机器人系统过程中存在的主要问题。
第三,聊天机器人能够适配多种数据管理的具体场景。如基于聊天机器人和“光学字符识别(Optical Character Recognition, OCR)”技术的名片管理应用,其核心功能是帮助人们巧妙、直观地管理名片,并作为虚拟助手提供个性化服务。
5.3 突发公共事件应急管理中的应用
新冠肺炎(Covid-19)疫情的爆发加速了新一代信息技术在公共治理尤其是公共卫生管理中的应用,如健康码、在线课堂等。人工智能技术在疫情信息管理中展现出巨大应用潜能,聊天机器人在疫情防控中的应用场景主要包括信息传播、风险评估、监测、感染后筛查、分布式协调和疫苗调度六个方面。以信息传播为例,世界卫生组织在新冠疫情期间推出了WhatsAPP聊天机器人,向数十亿人提供有关疾病传播及其症状的最新的、经过验证的真实信息,帮助抵制虚假信息的传播。实践表明,发生公共危机事件时,聊天机器人的信息传播、事态监测、信息指导以及适度的心理疏导功能在满足公众社会需求、保障社会效益等方面都具有积极作用。另有研究表明,聊天机器人能够在保持安全社交距离方面发挥作用,这个价值提升了人们对聊天机器人的积极态度和采纳程度。从效果上看,聊天机器人因其易用性、可触达性和广泛的适配性实现了对公共卫生管理的数字化赋能,提升了公共卫生应急能力。然而,由于需要对疫情进行快速反应,因此在技术上,聊天机器人大多使用相对简单的决策树结构并基于规则进行构建。
有研究指出,人工智能在赋能不同类型的突发事件管理方面共性大于特性。聊天机器人的作用主要体现为提升信息传播和沟通效率,提供知识服务和信息指导等。相对于日常情境,灾害管理中的数据更加复杂,数据量的快速增长也加剧了灾害管理中决策任务的复杂性。为应对这些困难,语言理解(Language Understanding, LU)技术可以提供帮助。比如,有研究关注了语言理解技术的开发,并针对灾害管理中的信息需求设计了定制化的对话系统框架,包括问答功能、知识库,以及一个可以处理相对复杂查询任务的搜索功能,提高了聊天机器人对用户问题的理解能力,从而能够分析用户需求。还有研究开发了一个包含水灾害数据库、用户意图识别机制和基于移动设备用户界面的聊天机器人系统,用户可以通过直接询问聊天机器人或通过操作图像菜单来访问决策所需的重要数据或信息。
6 聊天机器人采用与用户信任的 影响因素及其评估 |
实现聊天机器人在公共部门的应用,既需要来自供给侧公共部门的“采用”,也需要来自需求侧用户的信任和“使用”。相关研究包括三条研究脉络。第一条即从公共部门视角出发,研究采用聊天机器人的影响因素;第二条从用户视角出发,研究用户信任聊天机器人的影响因素;第三条则采取综合视角,探究如何对聊天机器人的应用效果和用户信任度进行评估与测评。
6.1 公共部门采用聊天机器人的影响因素
有研究表明,与技术因素和组织因素相比,环境因素对于组织采用人工智能技术的影响程度较低,而技术因素和组织因素的重要性则部分取决于组织采用人工智能技术这一过程处于何种阶段。从时间维度看,公共部门采用人工智能技术的过程可以划分为前期探索、中期使用和后期成熟三个阶段。在前期探索阶段,不太复杂的聊天机器人技术通常会被公共部门作为探索性应用所采用。来自中国的证据则表明,在政府门户网站上部署聊天机器人的主要驱动力不是来自于用户端的需求,而更多受到地方政府压力的影响,压力越大,政府越有可能采用聊天机器人;而准备程度(readiness)越高,政府门户网站上的聊天机器人效果则越好。所谓地方政府压力既有来自上级政府的垂直压力,也有来自同级政府的水平压力;准备程度则包括政策环境、组织环境、经济环境和技术应用等要素。
除了上述因素,法律与制度、数据与技术等因素也会影响公共部门对聊天机器人的采用。首先,有学者主张,为了将聊天机器人付诸实践,必须考虑一系列法律限制。聊天机器人一方面虽然突破了以往现实的限制,但另一方面也对现有的法律概念提出了挑战。例如,现行法律中关于自动化客户服务的法律责任界定尚不完善。其次,来自乌克兰的案例表明,官员的意愿可能会影响聊天机器人是否能够在公共部门采用。因为由人工智能驱动的聊天机器人虽然带来了自动化水平的提升,但可能会重塑或替代一些原本由特定官员执行的环节或过程,因而引致反对。再次,数据质量与数据可用性等技术因素和数据隐私等法律因素可能会影响聊天机器人的引入。一方面,公共部门的工作受到隐私立法的限制,通常无法使用来自私人部门的数据;另一方面,聊天机器人的采用通常要求相关数据能够随时可用,并能够被结构化处理、集成和更新。最后,数字鸿沟也会影响聊天机器人的采用。人们可能由于缺乏相关技能、无法实现网络连接和没有智能手机等而无法使用聊天机器人,致使公共部门无法通过聊天机器人满足更多公民的利益和需求。
6.2 用户信任聊天机器人的影响因素
在人机交互领域,所谓信任是指用户对人工智能的建议、行动和决策有信心,信任度则指愿意根据这些建议、行动和决策采取行动的程度。信任对于交互至关重要,无论是线下还是线上;如果没有信任,就不可能有一个强大的、互动的在线环境。对于线上服务而言,信任意味着用户通过网络与陌生的服务提供者进行交互,需要克服对风险和不确定性的感知。信任是用户决定在多大程度上采用人工智能技术的重要先决条件,因此研究用户信任聊天机器人的影响因素对于发挥聊天机器人优势而言十分重要。
首先,聊天机器人本身的技术特性对于用户信任具有重要影响。政务类聊天机器人具有智能性、拟人性、个性化等技术特性,能够对初始信任(initialtrust)同时产生直接和间接两种大体相当的正向影响。同时,用户对聊天机器人的信任会受到其对于用户请求的解读质量、人性化程度以及外观展示的专业程度等技术特征的影响。此外,聊天机器人的应用场景也可能影响用户信任度。来自中国的实验证据表明,公众对人工智能参与决策的信任度受到决策类型的影响。
其次,交互的方式也会影响用户对聊天机器人的信任。有研究表明,采用社交型交互方式设置的聊天机器人,比采用任务型交互方式设置的聊天机器人更能带给用户高水平的社交存在感(perception of social presence)。据此,聊天机器人不仅需要为用户提供必要的咨询和指导,还需要进行友好的交流。当用户与聊天机器人互动时,如果聊天机器人为他们提供建议性指导并以友好的方式进行交流,用户会感知到更高的认知契合度(cognitive fit)。
再次,用户对聊天机器人的初始了解以及聊天机器人的社会影响力(social influence)将对用户的初始信任产生影响。一方面,公众的初始信任一定程度上取决于聊天机器人的应用领域和政府是否向公众宣传引入聊天机器人的目的。一项来自日本的实验性在线调查结果表明,对公民沟通具有直接性的积极影响,例如及时响应,将增强公众对聊天机器人的信任。另一方面,所谓社会影响力是指“一个人对其他人认为他或她应该使用新系统的重要性的感知程度”,这意味着用户会关注其他人(如同龄人和家人)对聊天机器人的看法,这将相应地影响他们对聊天机器人的信任和决定。还有研究认为,面对陌生的在线系统,用户在缺乏相关经验时总是倾向于依赖社会影响力。
6.3 应用效果评估与用户信任度测评
不同行业领域应用聊天机器人的目的不尽相同,因此评估也应采用不同的标准。比如,银行和金融领域应用聊天机器人的主要目的是帮助用户快速地实现信息查询,在减少呼叫量的同时降低服务成本,因此评估指标之一是对话长度和对话结构,即用长度更短的和结构更简单的对话实现用户要求。与之不同,零售行业的聊天机器人试图通过鼓励用户浏览页面、提供产品反馈等手段保持用户的注意力,从而扮演个人购物助理的角色,因此参与度是评估该行业聊天机器人性能的关键指标。
随着公共部门对人工智能技术的运用日益普及,学界开始关注聊天机器人的运用成效。国外有学者通过综述形式构建了系统的聊天机器人应用效果评估体系。Peras综述了用以衡量聊天机器人投入成效的评价指标,归纳了五个视角的评估框架,包括用户体验视角、信息检索视角、语言视角、技术视角和业务视角,对应聊天机器人在14个方面的表现,即可用性、性能、影响、满意度、准确性、可访问性、效率、质量、数量、关系、方式、语法准确性、人性和商业价值。还有学者针对聊天机器人的可用性(usability)评估进行了综述,将相关指标归纳为效率(efficiency)、有效性(effectiveness)和满意度(satisfaction)三个维度,同时认为满意度比效率和有效性更应受到关注。另有学者综述了聊天机器人的质量(quality)评估,在对相关指标的质量属性进行提取并进行分组后认为,所谓质量与可用性的概念其实是一致的,即特定用户在特定环境中实现特定目标的有效性、效率和满意度。具体来说,有效性指的是特定用户实现其目标的准确性和完整性,而效率指的是如何更好地利用资源来实现这些目标。此外,在具体指标上,真实性、用户留存率和提供个性化交流的能力等也是评估聊天机器人性能的重要指标。如有实证研究表明,个性化水平是影响用户对心理健康型聊天机器人满意度的重要因素之一。
如前所述,用户信任是在多大程度上采用人工智能技术的重要先决条件。用户信任度则是评估聊天机器人性能的关键指标之一。对在线技术的信任可以通过易用性、风险度和诚信度进行评估。其中,易用性指用户对在线交互技术难易程度的感知,风险度关系到用户对不良后果的感知,诚信度则包括专业程度、可预测性和声誉等要素。此外,有文献补充了透明度和可控性等要素。另有研究提出了一个初步的客户服务聊天机器人信任模型,包括聊天机器人相关因素(专业知识和响应能力)、环境相关因素(风险和品牌声誉)和用户相关因素(信任技术的倾向)。具体到对公共部门聊天机器人的评估,相关实践尚未大范围铺开,应用领域大多局限于为政府网页提供咨询,还需深入的实践探索。
7 讨论 |
纵观国内外公共部门应用聊天机器人相关研究,可以发现如下四个特点。首先,在研究成果上,相较于国外学者的研究,国内开展的相关研究,尤其是对基于人工智能的聊天机器人在公共部门不同场景中应用的研究还比较少。其次,在研究方法上,相较于应用研究,理论研究相对较少。多数研究均采用案例研究法或实验法对聊天机器人在不同公共部门的应用进行分析,但少有学者从技术与组织关系或技术治理等角度对其进行理论探讨和逻辑思辨,这可能会制约相关研究的深化与扩展。再次,在研究对象上,受限于相关实践仅是初步展开,可聚焦的应用场景较为有限。最后,在研究内容上,对聊天机器人在公共部门中应用效果进行评估的研究很少,且尚未有研究试图构建系统的公共部门聊天机器人评估框架或评估体系。现有研究或未关注公共部门,或只关注对信任度等单个变量的评估,缺乏针对性和整体性,留下了进一步开拓的空间。
针对上述特点,未来的研究方向可向以下三个领域聚焦。第一,随着国内公共部门在治理活动中越来越多地利用聊天机器人技术,国内相关领域学者可以更多地关注这一现象,为实务界提供科学的理论指导和行动参考。第二,给予理论研究更多重视,探索聊天机器人在更多公共管理场景中的应用,归纳其一般规律,为公共部门规划既科学又可行的聊天机器人应用发展路径。第三,在综合各方面研究的基础上,着力构建面向公共部门的聊天机器人评估框架和评估体系并开展评价,为相关实践提供支持。
*参考文献略,请详见原文。 |
END
版式设计
陆澜
制版编辑
卢慧质
关注公众知识状态 / 引领学科发展潮流 Focusing on the State of Public Knowledge Leading the Development Trends of the Discipline |
网络首发 | 李国新:推动普惠性非基本公共文化服务发展
网络首发 | Kindle 走后怎样:数字阅读的未来
网络首发 | 知识重组与场景再构:面向数字资源管理的元宇宙
网络首发 | 论加快构建中国特色档案学学术体系
网络首发 | 因信而行:信息接触与信任对新冠疫苗接种意愿的影响(内含视频摘要)
网络首发 | “三个走向”:从《“十四五”全国档案事业发展规划》看档案工作发展趋势